2025-02-24 09:25:15.AIbase.
Moonlight e UCLA lançam novo modelo Mixture-of-Expert para melhorar a eficiência do treinamento de modelos de linguagem
2025-02-12 08:43:18.AIbase.
Li Yanhong discute o treinamento de modelos de IA de próxima geração: foco em progresso tecnológico e redução de custos
2025-02-10 10:31:26.AIbase.
Tencent solicita patente para 'método de treinamento de modelo de linguagem grande', melhorando a capacidade de generalização e a precisão do modelo
2025-02-08 17:52:43.AIbase.
Tencent publica nova patente para treinamento de modelos de linguagem de grande porte, melhorando a generalização e a precisão do modelo
2025-01-07 10:17:11.AIbase.
Google acelera o treinamento de modelos de IA grandes usando modelos menores, aumentando a eficiência em 28%
2025-01-06 10:24:02.AIbase.
Pesquisador chinês de Harvard, Jeffrey Wang, junta-se à OpenAI para focar em pré-treinamento e inferência de modelos
2025-01-02 11:53:32.AIbase.
Frota de veículos de coleta de dados lançada em Xangai acelera o treinamento de modelos de direção autônoma
2024-12-26 11:55:13.AIbase.
Avanço na Treinamento de IA! Nova estrutura CoMERA reduz significativamente os custos e o consumo de recursos do treinamento de modelos
2024-12-17 09:18:50.AIbase.
Midjourney lança modelos personalizados e Moodboards, permitindo o treinamento de modelos com imagens carregadas
2024-12-13 10:19:49.AIbase.
TPU Trillium da Google agora disponível! Desempenho aprimorado, eficiência máxima no treinamento de modelos de IA
2024-11-27 16:51:47.AIbase.
Otimizador "Budismo" C-AdamW: Uma linha de código acelera o treinamento de modelos grandes em 1,47 vezes!
2024-11-22 10:08:51.AIbase.
Tülu 3, solução de treinamento de código aberto da AI2, quebra o monopólio da tecnologia de pós-treinamento de modelos grandes
2024-11-13 13:56:05.AIbase.
Quebrando paradigmas! A precisão do treinamento de modelos de linguagem não é sempre melhor? 7-8 bits de precisão são o ideal?
2024-11-01 14:05:38.AIbase.
ByteDance lança HybridFlow, ferramenta open source que aumenta a velocidade de treinamento de modelos grandes em 20 vezes e reduz custos drasticamente!
2024-10-21 11:51:02.AIbase.
ByteDance responde a rumores de 'estagiário sabotando treinamento de modelo': sem impacto em projetos comerciais oficiais
2024-10-18 14:14:32.AIbase.
Nova política de compartilhamento de dados do X gera controvérsia: permissão padrão para treinamento de modelos de IA por terceiros levanta preocupações com a privacidade do usuário
2024-10-16 14:25:30.AIbase.
A tecnologia REPA aumenta a velocidade de treinamento de modelos de geração de imagens de IA em 17,5 vezes
2024-10-15 14:03:45.AIbase.
Volcano Engine lança solução de pré-processamento de vídeo para treinamento de modelos grandes, já adotada pela Doubao
2024-10-10 11:52:35.AIbase.
Writer usa dados sintéticos para reduzir o custo de treinamento de modelos de IA, desafiando gigantes do setor
2024-09-11 11:47:28.AIbase.